64 research outputs found

    Iniciação à internet

    Get PDF
    Texto produzido em 2011, e utilizado na UC de Tópicos de Informática.A Iniciação à Internet é um texto introdutório destinado a quem se inicie no mundo da Internet. O objectivo do texto é que o leitor consiga navegar na Internet, encontrar a informação que pretende através das diversas formas disponíveis, e consiga construir conteúdo, publicá-lo e publicitá-lo, utilizando para tal os conhecimentos mínimos e rápidos. Não é dado ênfase a sites concretos, muito embora sejam sempre referenciados sites para as funcionalidades introduzidas

    Essencial do Windows

    Get PDF
    O Essencial do Windows é um texto introdutório ao Sistema Operativo Microsoft Windows. Abordam-se os temas essenciais a um utilizador que se inicia nos computadores, o qual deve aplicar no seu próprio computador os conhecimentos que for aprendendo, principalmente se o tema lhe é novo. Por serem essenciais os conceitos introduzidos não são dependentes da versão do sistema operativo, sendo exemplificados simultaneamente no Windows XP (versão inglesa) e no Windows 7 (versão portuguesa)

    Robust question answering

    Get PDF
    Tese de Doutoramento em Informática na especialidade de Informática apresentada à Universidade AbertaUm sistema automático de pergunta resposta tem como objectivo dar uma resposta curta e precisa a uma pergunta formulada em língua natural, pesquisando uma base de conhecimento constituída por texto em língua natural. As fontes deste tipo de conhecimento são numerosas, dado que o texto escrito constitui uma forma preferencial de comunicação humana. A informação varia desde o tradicional texto editado, como é o caso das enciclopédias e dos artigos de jornal, até texto obtido através de modernos processos automáticos, como os reconhecedores automáticos de fala. O trabalho descrito no presente documento centra-se na língua Portuguesa e em sistemas de pergunta resposta de domínio aberto, o que significa que nem a pergunta nem a colecção de textos se restringem a uma área específica. Ambas as formas de texto escrito referidas no parágrafo anterior sãoo consideradas. Dado que a recuperação de informação é essencial num sistema de pergunta resposta, as técnicas mais actuais utilizadas nestas duas áreas neste tipo de sistema são objecto de um estudo aprofundado, tanto no que diz respeito aos seus aspectos mais práticos, como as suas motivações teóricas. Uma vez que um sistema nunca pode ser simples demais, desde que cumpra as especificações e produza resultados de elevada qualidade, é feita uma análise de custo benefício das técnicas passíveis de serem utilizadas, dando preferência a soluções simples. O principal objectivo do presente trabalho é assim estudar e desenvolver componentes inovadores para recuperação de informação e pergunta resposta, e a construção de um sistema de pergunta resposta completo, eficiente e robusto, capaz de competir com os sistemas mais avançados existentes actualmente. Uma opção importante tomada foi a utilização da língua Portuguesa, uma língua falada por um vasto número de pessoas, o que constitui um requisito importante para um sistema de pergunta resposta, quer pela existência de um volume importante de texto escrito disponível nesta língua, quer pelo número de possíveis utilizadores de uma aplicação específica para o Português. Há no entanto que ter em conta a existiência de menor número de recursos linguísticos para a língua Portuguesa, especialmente se comparada com a língua Inglesa, que é correntemente a "língua franca" da investigação científica. É precisamente este o motivo do presente documento estar escrito na língua Inglesa: permitir a participação nos trabalhos e a validação de resultados internacionalmente, sendo este facto totalmente compatível com a focalização do estudo e dos trabalhos na língua Portuguesa, alargando inclusivamente a sua divulgação para públicos não falantes da mesma. Na abordagem para a realização deste trabalho esta opção foi tomada em conjunto com uma outra que foi explorar as potencialidades da Wikipedia como recurso de base de QA, e que se revelou de extrema utilidade em várias vertentes do trabalho desenvolvido. As caracteristicas da Wikipedia que se consideraram mais relevantes foram o facto da informação estar disponível gratuitamente, e de resultar do esforço conjunto de um elevado número de utilizadores, o que viabiliza o desenvolvimento de aplicações para as quais seja util conhecimento enciclopédico e conhecimento de natureza ontológica. Ambas as vertentes foram utilizadas de forma inovadora no presente sistema. Apresenta-se neste trabalho o sistema de pergunta resposta, que foi desenvolvido de raiz, e que provou estar ao nível dos melhores sistemas de pergunta resposta, dado que foi submetido a avaliação em 2008 no Fórum de Avaliação Internacional CLEF (Cross Language Evaluation F orum) e se classificou em terceiro lugar entre os seis participantes concorrentes na categoria de sistemas de pergunta resposta em Português, onde era o único sistema a participar pela primeira vez. A taxa de primeiras respostas correctas foi de 32,5%. Este resultado permitiu obter o 5º lugar entre os 21 sistemas participantes nas 11 línguas disponíveis, sendo de referir o elevado nível dos sistemas concorrentes para o Português, dado que nos três primeiros lugares se classificaram dois sistemas para o Português, com o sistema da companhia Portuguesa Priberam ocupando a primeira posição com uma taxa de primeiras respostas correctas de 63,5% e o sistema da Universidade de Evora classificado em terceiro lugar, com uma taxa de primeiras respostas correctas de 46,5%. Os melhoramentos introduzidos após a análise dos resultados obtidos, que foi feita considerando quer as respostas do próprio sistema, quer as respostas produzidas pelos restantes sistemas, resultaram num considerável aumento da taxa de primeiras respostas correctas, para 50,5%, o que se seria correspondente a um segundo lugar nos resultados para o Português. O sistema desenvolvido é eficiente na indexação e resposta a perguntas, levando, na sua versão melhorada, apenas 4 horas para indexar toda a colecção de textos utilizada na tarefa do QA@CLEF 2008, e cerca de dois minutos a responder as 200 perguntas da tarefa, o que corresponde a uma média de 0,6 segundos para responder a uma pergunta. De referir que nenhum participante divulgou dados sobre a eficiência do sistema. Apenas se encontraram publicados dados de eficiência para um sistema que não participou na avaliação, que reporta valores médios de resposta por pergunta de 22 segundos. O sistema foi ainda testado num caso de estudo envolvendo perguntas efectuadas sobre o conteúdo de peças faladas. A base de textos que é pesquisada neste caso, consiste nos textos obtidos de forma automática a partir do reconhecimento automático da fala. Dado que a tarefa do Fórum de Avaliação CLEF para sistemas automáticos a responder a perguntas sobre transcrições automáticas (QAST - Question Answering over Speech Transcripts) não incluí a língua Portuguesa, os dados tiveram que ser todos recolhidos e organizados tendo sido criado um recurso que permite fazer testes de sistemas para o Português. Este recurso tem como base um corpo constituído pelos Telejornais da Rádio Televisão Portuguesa, RTP, nas suas edições da noite dos canais 1 e 2, correspondente aos meses de Junho a Setembro de 2008. Este corpo consiste em cerca de 180 horas de duração, transcritas automaticamente e enriquecidas com colocação automática de pontuação. Foi feito um conjunto de 100 perguntas, baseadas em transcrições manuais, e que foi utilizado para testar o sistema. O sistema demonstrou ser robusto, pois mesmo na presença de texto com palavras incorrectamente reconhecidas, ou pontuação colocada fora dos locais correctos, o sistema obteve 30% de taxa de primeiras respostas correctas, 42% de taxa de respostas correctas nas três primeiras respostas, e uma taxa de 60% de localização do excerto onde se encontra a resposta correcta. Este ultimo valor tem uma aplicação interessante de localização de um determinado tema num conjunto de diversas horas de vídeo, através de uma pergunta formulada em língua natural. Os resultados obtidos estão ao nível dos melhores reportados nas avaliações QAST do QA@CLEF. Dado que o principal objectivo traçado para o presente projecto de doutoramento, era estudar e desenvolver componentes inovadores de recuperação de informação e pergunta resposta que conduzissem a construção de um sistema de pergunta resposta para o Português, completo eficiente e robusto, e com resultados ao nível dos melhores sistemas, considera-se que o objectivo foi plenamente atingido. Relativamente ao uso do Português como língua de trabalho, confirma-se o facto de que os resultados obtidos para esta língua na área de sistemas de pergunta resposta estão ao melhor nível dos sistemas actuais para outras línguas, provando-se ser possível ultrapassar o problema de escassez de recursos. Os resultados validam também o conceito da existência de corpus onde coexistem textos com origem em distintas variantes de Português, nomeadamente Europeia e Brasileira, mas não só. No que diz respeito a língua falada, os resultados obtidos no caso de estudo indicam uma necessidade de tratamento específico para estas duas diferentes variantes do Português.A Question Answering (QA) system should provide a short and precise answer to a question in natural language, by searching a large knowledge base consisting of natural language text. The sources of the knowledge base are widely available, for written natural language text is a preferential form of human communication. The information ranges from the more traditional edited texts, for example encyclopaedias or newspaper articles, to text obtained by modern automatic processes, as automatic speech recognizers. The work described in the present document focuses on the Portuguese language and open domain question answering, meaning that neither the questions nor the texts are restricted to a speci c area, and it aims to address both types of written text. Since information retrieval is essential for a QA system, a careful analysis of the current state-of-the-art in information retrieval and question answering components is conducted. A complete, e cient and robust question answering system is developed in this thesis, consisting of new modules for information retrieval and question answering, that is competitive with current QA systems. The system was evaluated at the Portuguese monolingual task of QA@CLEF 2008 and achieved the 3rd place in 6 Portuguese participants and 5th place among the 21 participants of 11 languages. The system was also tested in Question Answering over Speech Transcripts (QAST), but outside the o cial evaluation QAST of QA@CLEF, since Portuguese was not among the available languages for this task. For that reason, an entire test environment consisting of a corpus of transcribed broadcast news and a matching question set was built in the scope of this work, so that experiments could be made. The system proved to be robust in the presence of automatically transcribed data, with results in line with the best reported at QAST

    Building and exploring semantic equivalences resources

    Get PDF
    Language resources that include semantic equivalences at word level are common, and its usefulness is well established in text processing applications, as in the case of search. Named entities also play an important role for text based applications, but are not usually covered by the previously mentioned resources. The present work describes the WES base, Wikipedia Entity Synonym base, a freely available resource based on the Wikipedia. The WES base was built for the Portuguese Language, with the same format of another freely available thesaurus for the same language, the TeP base, which allows integration of equivalences both at word level and entity level. The resource has been built in a language independent way, so that it can be extended to different languages. The WES base was used in a Question Answering system, enhancing significantly its performance.info:eu-repo/semantics/publishedVersio

    Document retrieval for question answering : a quantitative evaluation of text preprocessing

    Get PDF
    Question Answering (QA) has been an area of interest for researchers, in part motivated by the international QA evaluation forums, namely the Text REtrieval Conference (TREC), and more recently, the Cross Language Evaluation Forum (CLEF) through QA@CLEF, that since 2004 includes the Portuguese language. In these forums, a collection of written documents is provided, as well as a set of questions, which are to be answered by the participating systems. Each system is evaluated by its capacity to answer the questions, as a whole, and there are relatively few results published that focus on the performance of its different components and their influence on the overall system performance. That is the case of the Information Retrieval (IR) component, which is broadly used in QA systems. Our work concentrates on the different options of preprocessing Portuguese text before feeding it to the IR component, evaluating their impact on the IR performance in the specific context of QA, so that we can make a sustained choice of which options to choose. From this work we conclude the clear advantage of the basic preprocessing techniques: case folding and removal of punctuation marks. For the other techniques considered, stop word removal enhanced the performance of the IR system but that was not the case as far as Stemming and Lemmatization are concerned.info:eu-repo/semantics/publishedVersio

    Robust question answering

    Get PDF
    A Question Answering (QA) system should provide a short and precise answer to a question in natural language, by searching a large knowledge base consisting of natural language text. The sources of the knowledge base are widely available, for written natural language text is a preferential form of human communication. The information ranges from the more traditional edited texts, for example encyclopaedias or newspaper articles, to text obtained by modern automatic processes, as automatic speech recognizers. The work developed in the present thesis focuses on the Portuguese language and open domain question answering, meaning that neither the questions nor the texts are restricted to a specific area, and it aims to address both types of written text. Since information retrieval is essential for a QA system, a careful analysis of the current state-of-the-art in information retrieval and question answering components was conducted. A complete, efficient and robust question answering system is developed in this thesis, consisting of new modules for information retrieval and question answering, that is competitive with current QA systems. The system was evaluated at the Portuguese monolingual task of QA@CLEF 2008 and achieved the 3rd place in 6 Portuguese participants and 5th place among the 21 participants of 11 languages. The system was also tested in Question Answering over Speech Transcripts (QAST), but outside the official evaluation QAST of QA@CLEF, since Portuguese was not among the available languages for this task. For that reason, an entire test environment consisting of a corpus of transcribed broadcast news and a matching question set was built in the scope of this work, so that experiments could be made. The system proved to be robust in the presence of automatically transcribed data, with results in line with the best reported at QAST.info:eu-repo/semantics/publishedVersio

    IdSay: question answering for portuguese

    Get PDF
    IdSay is an open domain Question Answering (QA) system for Portuguese. Its current version can be considered a baseline version, using mainly techniques from the area of Information Retrieval (IR). The only external information it uses besides the text collections is lexical information for Portuguese. It was submitted to the monolingual Portuguese task of the QA track of the Cross-Language Evaluation Forum 2008 (QA@CLEF) for the first time, and it answered correctly to 65 of the 200 questions in the first answer, and to 85 answers considering the three answers that could be returned per question. Generally, the types of questions that are answered better by IdSay system are measure factoids, count factoids and definitions, but there is still work to be done in these areas, as well as in the treatment of time. List questions, location and people/organization factoids are the types of question with more room for improvement.info:eu-repo/semantics/publishedVersio

    Impasses na Constituição de Mecanismo de Mudança Climática: a experiência de uma empresa brasileira de geração de energia elétrica proveniente do lixo

    Get PDF
    Este artigo tem como objetivo apresentar os impasses na constituição do Mecanismo de Desenvolvimento Limpo (MDL) que emergem da experiência de uma empresa brasileira de geração de energia elétrica proveniente de resíduos sólidos urbanos. O MDL, emanado do Protocolo de Quioto no combate às mudanças climáticas conferiu ao Brasil uma posição líder de defesa do mesmo. Entretanto, apesar do reconhecimento da sua importância, este tem enfrentado barreiras para a sua efetivação, o que nos leva a supor que os impasses para a sua internalização podem ser não somente relacionados à eficácia instrumental, tecnológica e operacional mais amplamente discutidos na literatura pertinente, mas também às suas próprias características, de natureza político-institucional, envolvendo o comprometimento dos países com a redução de suas emissões. Para explorar essa suposição, desenvolveu-se uma pesquisa qualitativa de caráter descritivo, por meio de pesquisa bibliográfica, documental e de campo, analisando-se o discurso do corpus empírico. Privilegiaram-se as visões de atores-chave locais relacionados ao mecanismo em estudo, em entrevistas, observação e visita à empresa escolhida. Os resultados da pesquisa evidenciam dinâmicas complexas na constituição do MDL, sugerindo a necessidade de se aprofundar as argumentações sobre a sua efetiva contribuição para o desenvolvimento sustentável e sugerem o aprofundamento das matrizes teóricas da abordagem institucional e suas interfaces com outras abordagens teóricas que envolvam a questão do poder nas dimensões público-privado e nas esferas global-local

    Casos de abuso sexual de menores na Diretoria do Norte da Polícia Judiciária no ano de 2011

    Get PDF
    Projecto de Graduação apresentado à Universidade Fernando Pessoa como parte dos requisitos para obtenção do grau de Licenciada em CriminologiaCom o presente trabalho pretende-se avaliar a incidência dos casos de abuso sexual durante o ano de 2011, registados na Diretoria do Norte da Polícia Judiciária, fazendo igualmente uma perspetiva sucinta ao longo dos últimos 11 anos, nomeadamente se houve aumento ou diminuição do número de processos. Pretende-se ainda identificar diferentes perfis criminais associados a este tipo de crime, analisando caraterísticas das vítimas, dos agressores e da ocorrência. Foram recolhidos dados informaticamente, relativos a 361 inquéritos de abuso sexual de menores, do ano de 2011, com recurso ao SIIC (Sistema de Informação de Investigação Criminal). A maioria das vítimas (78,6%) era do género feminino, sendo a média de idades de 11 anos. O grupo mais afetado foi o de idades compreendidas entre os 12 e os 14 anos. No que respeita aos agressores 84,9% eram do género masculino, a média de idades situa-se nos 40 e o grupo com maior frequência é o dos 47 anos de idade, com 10%. A maioria dos ofensores eram casados ou viviam em união de facto (38,1%), à data dos factos. Foram analisados sete tipos legais de crime, sendo que o abuso sexual de crianças foi o que mais ocorreu (53,9%). Quando avaliamos os padrões espaço culturais detetou-se que o Porto com 16,9%, foi o concelho com maior incidência, bem como a residência (57%), setembro (7,5%) e a sexta feira (12,7%) apresentaram igualmente mais incidência. This work assesses the amount of sexual abuse cases registered in the Northern Directory of the Portuguese Judiciary Police, during the year of 2011. Additionally, it presents a brief perspective on the last 11 years, regarding a potential increase or decrease in the number of cases, as well as a resume of criminal profiles associated to this type of crime, analysing victim, aggressor and occurrence profiles. A data collection was performed via IT systems, regarding 361 inquiries on sexual abuse of minors in 2011, and based on SIIC (Sistema de Informação de Investigação Criminal – Portuguese Information System for Criminal Investigation). Most victims (78.6%) were female, presenting an average age of 11.88. The most affected group was amongst youths from 12 to 14 years. Concerning the aggressors, 84.9% were male with an average age of 40.62. The most highly represented group was that of 47 years, accounting 10.1%. Most aggressors were married or in a non-marital partnership (38.1%). Seven types of explicit crime were analysed, where sexual abuse of children was the most common one (53.9%). When assessing spatial and cultural patterns, it was evident that the district of Porto with 16.9% had the highest incidence. Also, these crimes occurred most frequently in homes (57%), in the month of September (7.5%) and on Fridays (12.7%)

    Casos de abuso sexual de menores na Diretoria do Norte da Polícia Judiciária no ano de 2011

    Get PDF
    Projecto de Graduação apresentado à Universidade Fernando Pessoa como parte dos requisitos para obtenção do grau de Licenciada em CriminologiaCom o presente trabalho pretende-se avaliar a incidência dos casos de abuso sexual durante o ano de 2011, registados na Diretoria do Norte da Polícia Judiciária, fazendo igualmente uma perspetiva sucinta ao longo dos últimos 11 anos, nomeadamente se houve aumento ou diminuição do número de processos. Pretende-se ainda identificar diferentes perfis criminais associados a este tipo de crime, analisando caraterísticas das vítimas, dos agressores e da ocorrência. Foram recolhidos dados informaticamente, relativos a 361 inquéritos de abuso sexual de menores, do ano de 2011, com recurso ao SIIC (Sistema de Informação de Investigação Criminal). A maioria das vítimas (78,6%) era do género feminino, sendo a média de idades de 11 anos. O grupo mais afetado foi o de idades compreendidas entre os 12 e os 14 anos. No que respeita aos agressores 84,9% eram do género masculino, a média de idades situa-se nos 40 e o grupo com maior frequência é o dos 47 anos de idade, com 10%. A maioria dos ofensores eram casados ou viviam em união de facto (38,1%), à data dos factos. Foram analisados sete tipos legais de crime, sendo que o abuso sexual de crianças foi o que mais ocorreu (53,9%). Quando avaliamos os padrões espaço culturais detetou-se que o Porto com 16,9%, foi o concelho com maior incidência, bem como a residência (57%), setembro (7,5%) e a sexta feira (12,7%) apresentaram igualmente mais incidência. This work assesses the amount of sexual abuse cases registered in the Northern Directory of the Portuguese Judiciary Police, during the year of 2011. Additionally, it presents a brief perspective on the last 11 years, regarding a potential increase or decrease in the number of cases, as well as a resume of criminal profiles associated to this type of crime, analysing victim, aggressor and occurrence profiles. A data collection was performed via IT systems, regarding 361 inquiries on sexual abuse of minors in 2011, and based on SIIC (Sistema de Informação de Investigação Criminal – Portuguese Information System for Criminal Investigation). Most victims (78.6%) were female, presenting an average age of 11.88. The most affected group was amongst youths from 12 to 14 years. Concerning the aggressors, 84.9% were male with an average age of 40.62. The most highly represented group was that of 47 years, accounting 10.1%. Most aggressors were married or in a non-marital partnership (38.1%). Seven types of explicit crime were analysed, where sexual abuse of children was the most common one (53.9%). When assessing spatial and cultural patterns, it was evident that the district of Porto with 16.9% had the highest incidence. Also, these crimes occurred most frequently in homes (57%), in the month of September (7.5%) and on Fridays (12.7%)
    corecore